Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles
نویسندگان
چکیده
We describe here a method to use a language modeling approach for image retrieval and image categorization. Since photographic images are 2D data, we first use image regions (mapped to automatically induced concepts) and then spatial relationships between these regions to build a complete image graph representation. Our method deals with different scenarios, where isolated images or groups of images are used for training and/or testing. The results obtained on an image categorization problem show (a) that the procedure to automatically induce concepts from an image is effective, and (b) that the use of spatial relationships, in addition to concepts, for representing an image content helps improve the classifier accuracy. This approach extends the language modeling approach to information retrieval to the problem of graph-based image retrieval and categorization, without considering image annotations. MOTS-CLÉS : Représentation de graphes, recherche d’image, catégorisation d’image
منابع مشابه
Un modèle génératif pour l'Apprentissage de la Topologie
Résumé. Un nuage de points est plus qu’un ensemble de points isolés. La distribution des points peut être gouvernée par une structure topologique cachée, et du point de vue de la fouille de données, modéliser et extraire cette structure est au moins aussi important que d’estimer la seule densité de probabilité du nuage. Dans cet article, nous proposons un modèle génératif basé sur le graphe de ...
متن کاملHuMan vision PercePtion in built environMent Applying image-based approach for architectural cue recognition
This paper first presents a review on visual perception in the built environment and human vision simulation. Followed by the description of the Standard Feature Model of visual cortex (SFM), an architectural cue recognition model is proposed using SFM-based features. Based on the findings of the experiments it can be concluded that the visual differences between architectural cues are too subt...
متن کاملConception automatisée de modèles de page en vue de leur utilisation en reconnaissance de documents
RÉSUMÉ. Le but de cet article est de décrire un modèle de page utilisé en reconnaissance de documents et sa construction automatisée. Ayant choisi une modélisation fondée sur la perception, l’architecture du modèle se confond avec la description physique des pages. La structure logique est décrite en termes de relations et d’attributs associés aux composants physiques. L’apprentissage est réali...
متن کاملUne représentation en graphe pour l'enseignement de XML
XML est un format actuellement très utilisé. Dans le cadre des formations en informatique, il est indispensable d’initier les étudiants à ce format et, surtout, à tout son éco-système. Nous avons donc mis au point un modèle permettant d’appuyer l’enseignement de XML. Ce modèle propose de représenter un schéma XML sous la forme d’un graphe mettant en valeur les caractéristiques structurelles des...
متن کاملModélisation de relations dans l'approche modèle de langue en recherche d'information
RÉSUMÉ. Nous abordons dans cet article le problème de la prise en compte de relations (par exemple de nature syntaxique ou sémantique) dans un modèle de langues en recherche d’information. En particulier, nous proposons, sur la base du modèle de langue, un cadre complet pour la prise en compte de relations, étiquetées ou non. Afin d’illustrer ce cadre, nous avons conduit une série d’expériences...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Document Numérique
دوره 13 شماره
صفحات -
تاریخ انتشار 2010